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导语 
目前 国际 形势 风起云涌 ， 加 强 我 国 在 海外 的 传媒 影 
响 能 力 势 在 必 行 。 而 随 着 云 计 算 技术 和 互联 网 的 快速 发 
展 ， 传 统 媒体 面临 从 “ 纸 媒 ”到 “ 屏 媒 ”的 用 户 之 变 。 
如 今 时 代 谁 掌握 了 互联 网 ， 谁 就 把 握 住 了 时 代 主 动 权 ， 
而 云 计算 技术 又 是 互联 网 发 展 的 重要 基石 ， 所 以 基于 公 
有 云 的 新 闻 服 务 平台 架构 应 运 而 生 。 
1. 公有 云 发 展现 状 

公有 云 服务 是 云 服 务 厂 商 提供 的 一 种 面向 公众 的 云 
资源 共享 服务 。 公 众 可 按 需 购买 公有 云 服务 ， 其 按 服务 
模式 可 分 为 [aaS( 基础 设施 即 服务 )、PaaS (平台 即 服务 )、 
SaaS( 软件 即 服 务 ) 三 个 服务 层次 。 

(1 ) Iaas 层 是 将 计算 、 网 络 、 存 储 等 资源 虚拟 化 后 
以 服务 方式 提供 给 公众 。 其 是 云 计算 中 最 基础 的 资源 ， 
也 是 云 服务 商 最 主要 的 收入 来 源 。 

(2 ) PssS 层 是 建立 在 Iaas 层 之 上 的 平台 层 ， 即 将 
中 间 件 、 数 据 库 等 资源 封装 后 为 应 用 程序 提供 良好 的 开 
发 运行 时 环境 。 

(3 ) SaaS 层 是 公有 云 服 务 商 将 其 成 熟 的 应 用 软件 部 
署 于 其 云 平 台 上 提供 服务 。 公 众 可 通过 其 提供 的 软件 接 
口 或 者 通过 web 浏览 器 访问 。 用 户 购 买 SaaS 层 服务 将 极 
大 地 节约 软件 开发 及 运 维 成 本 ， 然 而 SaaS 层 服务 是 面向 
多 租户 的 软件 即 服 务 ， 其 在 针对 单一 用 户 的 个 性 化 定制 
方面 仍然 存在 不 足 。 

目前 全 球 云 计算 市 场 迅 猛 发 展 ， 尤 其 是 2020 年 新 
冠 肺炎 疫情 的 爆发 极 大 地 刺激 了 公有 云 服 务 市 场 的 投资 。 
据 IDC 调查 人 研究， 很 多 服务 商 的 云 计算 策略 因 受 一 季度 
疫情 影响 ， 都 发 生 了 变化 ， 大 概 有 28% 的 企业 计划 全 部 
向 公有 云 服 务 转 移 ，48% 的 企业 计划 将 云 服 务 部 分 向 公 
有 云 服务 转移 。 在 第 二 季度 ， 服 务 商 在 基础 设施 投资 方 
面 也 出 现 明显 变化 ， 基 于 公有 云 服务 的 基础 设施 投资 增 
长 了 49 %， 而 基于 传统 IT 的 基础 设施 投资 下 降 了 9%， 
IDC 根据 这 个 调研 数据 预计 2022 年 基于 公有 云 方面 的 基 
础 设施 的 建设 投资 将 占据 主导 地 位 ， 超 过 传统 的 IT 基础 


设施 投资 。 
2. 新 闻 服 务 平台 架构 设计 
2.1 新 闻 服 务 平台 

新 闻 服 务 平台 ( 即 供稿 平台 ) 是 基于 互联 网 的 、 面 
向 新 闻 机 构 用 户 , 提供 包括 所 有 新 华 社 文字 、 图 片 、 图 表 、 
视频 、 新 媒体 、 多 媒体 、 历 史 资 料 和 第 三 方 产 品 的 在 线 
供稿 服务 和 信息 数据 在 线 推送 服务 的 技术 系统 。 

新 闻 服 务 平台 主要 的 业务 场景 包含 : ( 1 ) 在 线 推送 ( 2 ) 
在 线 浏览 (3 ) 用 户 订 购 信息 管理 (4 ) 在 线 点 题 (5 ) 产 
品 在 线 打包 和 发 布 (6 ) 用 户 管理 (7 ) 在 线 交 流 与 通知 (8) 
新 媒体 内 容 展 示 (9 ) 在 线 检索 ( 10 ) 运营 分 析 (11 ) 第 
三 方 平 台 ( 12 ) 服务 能 力 监控 。 

新 闻 服 务 平台 每 日 产生 稿件 数据 总 量 大 约 为 40G。 
平台 将 存储 3 个 月 的 生产 数据 。 稿 件数 据 分 为 稿件 原始 
数据 、 稿 件 元 数据 。 稿 件 原 始 数据 为 XML 文件 和 附件 文 
件 。 其 中 ，XML 文件 为 稿件 描述 ， 稿 件 附件 文件 主要 类 
型 为 图 片 、 视 频 、 音 频 、HTML/CSS/JS、PDF、CDR、ZIP 
文件 等 。 文 字 主 要 存储 在 NoSQL 数据 库 和 MySQL 关系 数 
据 库 ,图片 的 实体 存储 在 NAS 存储 ， 图 片 的 元 数据 信息 
存储 在 MySQL 关系 数据 库 。 其 它 附件 元 数据 也 同样 存储 
在 MySQL 数据 库 ， 实 体 文件 存储 在 NAS 存储 。 图 片 除 对 
外 供稿 外 , 需要 进行 中 图 和 小 图 的 抽 图 ， 用 于 网 页 展示 。 
视频 除 对 外 供稿 外 ， 可 能 需要 进行 视频 转 码 和 关键 帧 抽 
取 等 。 

新 闻 服 务 平台 将 通过 客户 端 同步 、EMail、RSS、 
API 接口 、FTP 推送 等 方式 ， 为 海外 机 构 用 户 提 供 支 持 
XinhuaML、 CNML、 NewsML、 SimpleML、 RSS、IPTC 、 
纯 文 本 等 格式 的 数据 服务 。 

2.2 架构 设计 

新 闻 服务 平台 ( 即 供稿 平台 ) 采用 基于 公有 云 的 架 
构 设 计 ， 用 极 短 的 时 间 搭 建 起 以 亚太 (香港 ) 、 北 美 ( 美 
国 ) 、 欧 洲 (法 国 ) 三 个 站 点 为 核心 ( 如 图 1 所 示 ) 、 
可 扩展 、 履 盖 全 球 的 云 供稿 服务 ， 实 现 稿 件 全 球 快 速 分 
发 ， 为 海外 用 户 提 供 一 站 式 云 供稿 服务 。 新 闻 服 务 平台 
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北京 站 点 为 新 华 社 自 有 站 点 , 其 与 亚太 站 点 、 北 美 站 点 、 
欧洲 站 点 存储 的 稿件 数据 基本 一 致 ， 缓 存 的 热点 稿件 数 
据 会 因 各 地 机 构 用 户 访问 情况 的 不 同 而 不 同 。 用 户 在 线 
下 载 、 浏 览 、 评 论 等 行为 数据 将 回 传 北京 站 点 。 


1 新 闻 服 务 平台 架构 


2.2.1 网 络 自 定义 

采用 公有 云 的 网 络 自 定义 能 力 ， 根据 部 署 需要 ， 
自行 定义 、 规 划 、 管 理 网 络 ， 包 括 自 定义 划分 子 网 地 
址 、 自 定义 安全 组 的 ACL 规则 等 。 公 有 云 中 的 虚拟 私 
有 云 (VPC ) 可 以 在 云端 构建 一 个 或 多 个 隔离 的 网 络 
环境 ， 在 保证 网 络 安全 的 同时 又 满足 了 自主 定义 网 络 
的 诉求 。 

根据 新 闻 服 务 平 台 需 求 特点 ， 在 亚太 、 北 美 、 欧 洲 
分 别 建 立 了 一 个 单独 的 VPC， 同时 将 应 用 系统 分 为 发 布 
层 、 应 用 服务 层 、 基 础 组 件 层 ， 通 过 安全 组 技术 ， 形 成 
三 个 对 应 的 安全 组 ， 保 障 业 务 的 逻辑 隔离 ， 确 保 实现 最 
小 权限 访问 ,保障 安全 。 而 互联 网 接 入 区 采用 公有 云 的 
防 DDoS 服务 和 WAF 服务 ， 互 联网 出 口 端 则 使 用 动态 
BGP， 保 证 通信 的 高 可 用 性 、 低 时 延 ， 不 受 运 营 商 影响 。 
2.2.2 稿件 数据 同步 
稿件 数据 的 传输 同步 离 不 开 基 础 传输 网 络 环境 ， 而 
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(1 ) 在 香港 站 点 创建 MongoDB 数据 库 ， 用 于 存放 
稿件 文件 ; 

(2 ) 北京 主 站 的 供稿 系统 ， 将 主 站 的 稿件 数据 同步 
上 传 到 香港 的 数据 库 中 ; 

(3 ) 我 国 香港 、 法 国 和 美国 的 供稿 平台 ， 都 通过 访 
问 我 国 香港 的 数据 库 ， 来 加 载 和 获取 稿件 。 
2.2.3 高 可 靠 性 设计 

新 闻 服 务 平 台 的 高 可 靠 性 设计 首先 是 云 平台 自身 的 
高 可 靠 性 设计 : (1) 配置 反 亲 和 性 策略 : 反 亲 和 性 主要 
是 出 于 高 可 靠 性 考虑 ， 尽 量 分 散 实 例 ， 某 个 节点 故障 的 
时 候 ， 对 应 用 的 影响 只 是 一 个 实例 。 云 服务 器 组 内 的 弹 
性 云 服 务 器 将 遵循 反 亲 和 策略 ， 尽 量 分 散 地 创建 在 不 同 
主机 上 ， 提 高 可 靠 性 保证 。 (2 ) 云 服务 器 HA 自动 恢复 
策略 : 当 计算 节点 宕 机 或 者 虚拟 机 状态 为 error， 系 统 可 
以 将 具有 HA 属性 的 虚拟 机 故障 迁移 到 其 他 健康 的 计算 
节点 ， 保 证 虚拟 机 能 够 快速 恢复 。 在 创建 云 主机 时 ， 打 
开 主 机 HA 自动 恢复 功能 ， 保 障 业 务 的 高 可 靠 性 。 (3 ) 
数据 备份 : 采用 虚拟 机 数据 备份 、 管 理 数据 备份 等 手段 
来 保障 高 可 靠 。 当 需要 恢复 数据 时 , 根据 需要 的 备份 文件 ， 
管理 节点 可 以 自动 将 数据 恢复 到 备份 时 间 点 。 其 次 是 新 
闻 服 务 平台 系统 多 站 点 的 高 可 靠 性 设计 : 通过 全 局 负责 
均衡 , 海外 用 户 不 但 能 就 近 更 高 效 地 访问 新 闻 服务 平台 ， 
而 且 当 某 个 站 点 出 问题 时 ， 也 能 及 时 快速 地 切换 至 别 的 
站 点 访问 。 
3. 应 用 效果 及 效益 

公有 云 资源 快速 部 署 ， 相 较 于 传统 物理 服务 器 部 署 
方式 ， 极 大 缩短 部 署 时 间 ， 人 快速 完成 所 有 海外 供稿 用 户 
的 上 云 迁 移 。 

基于 公有 云 的 新 闻 服 务 平台 实现 了 全 球 站 点 统一 运 
维 ， 用 户 统一 服务 ， 提 高 供稿 用 户 服 务 和 响应 能 力 。 全 
球 多 站 点 集中 维护 ， 不 仅 大 幅 降低 运 维 成 本 ， 而 且 提升 
了 对 海外 营销 的 技术 支撑 保障 力度 。 基 于 云 节 点 全 球 覆 
盖 面 广 的 特性 , 新 闻 服 务 平台 根据 供稿 系统 的 用 户 分 布 ， 


国际 互联 网 环境 复杂 不 稳定 ， 因 此 为 保障 稿件 数据 同步 
的 稳定 ， 新 闻 服 务 平台 采用 公有 云 专线 接口 服务 将 北京 
站 点 与 亚太 站 点 ( 即 香港 站 点 ) 通 过 两 条 宛 余 的 专线 连通 ， 
而 亚太 站 点 、 欧 洲 站 点 、 北 美 站 点 之 间 则 通过 公有 云 
的 云 专线 服务 互 连 。 

稿件 数据 同步 如 图 2 所 示 ， 流 程 如 下 : 


供稿 平台 (法 国 ) 
民 入 平 各 
业务 系统 
| 稿件 沪 取 NFS 
供稿 平台 (北京 ) | 供稿 平台 (香港 ) 后 
同步 控制 | 。 ,| 供 往 平 各 (人 全) 和 mv 
供稿 平台 。 | 稿件 数据 | 业务 系统 RE 
业务 系统 。 | 同步 控制 Ns | 弄 -一 一 - 
稿件 传 入 e 
上 素材 库 VM 
件 文件 存储 | ©) 
eth | 移 供稿 平台 (美国 ) 
Me 供稿 平台 
人 业务 系统 
,稿件 该 取 NFS 
和 全 sm 


2 稿件 数据 同步 


灵活 选择 部 署 节点 ,使 得 用 户 能 就 近 访问 云 供稿 服务 。 

基于 公有 云 的 新 闻 服 务 平台 具有 灵活 扩展 优化 的 特 
性 。 根据 云 供稿 服务 实际 的 运行 情况 , 对 系统 CPU、 内 存 、 
存储 、 网 络 资源 进行 灵活 高 效 的 扩展 优化 ， 保 障 云 供稿 
服务 时 刻 处 在 性 能 最 佳 状 态 ， 尤 其 是 在 重大 保障 期 间 ， 
大 量 重要 稿件 的 播 出 ， 用 户 访问 激增 ， 对 基础 环境 的 支 
撑 要 求 尤为 严格 ， 公 有 云 服务 采用 优先 服务 、 重 点 保障 
的 原则 ， 提 前 优化 扩充 资源 ， 为 重 保 期 间 用 户 提供 优质 
服务 。 

随 着 公有 云 服务 不 断 优化 ， 用 户 访 问 海外 各 站 点 
较 访 问 北 京 站 点 ，web 系统 和 稿件 FTP 推送 的 平均 延 
时 缩短 了 2-3 秒 ， 速 度 提升 了 速度 提高 60% 以 上 ， 取 
得 了 很 好 的 社会 效益 ,增强 了 我 社 供稿 服务 的 形象 和 
品牌 竞争 力 。 由 于 公有 云 服 务实 现 了 计算 、 存 储 、 网 
(下 转 第 113 页 ) 


